import os
import json

# 原始系统配置
CONFIG = {
    # API密钥
    "openai_api_key": "YOUR_API_KEY",
    "openai_base_url": "YOUR_BASE_URL",
    "boss_api_key": "YOUR_BOSS_API_KEY",
    
    # 数据源配置
    "job_sources": ["BOSS直聘", "智联招聘", "拉勾"],
    "report_sources": ["麦肯锡", "普华永道", "德勤"],
    
    # 模型参数
    "embedding_model": "text-embedding-3-small",
    "llm_model": "gpt-4o",
    
    # 系统参数
    "update_frequency": 24,  # 数据更新频率(小时)
    "similarity_threshold": 0.75,  # 相似度阈值
}

# 行业领域映射
INDUSTRY_MAPPING = {
    "AI医疗": ["医疗AI", "智能诊断", "医学影像AI", "智能医疗"],
    "绿色能源": ["新能源", "可再生能源", "清洁能源", "碳中和"],
    "数据科学": ["数据分析", "大数据", "数据挖掘", "商业智能"],
    "人工智能": ["机器学习", "深度学习", "自然语言处理", "计算机视觉"],
    "金融科技": ["区块链", "加密货币", "智能投顾", "金融AI"],
    "云计算": ["云服务", "云原生", "分布式计算", "容器技术"],
    "网络安全": ["信息安全", "网络防御", "安全审计", "渗透测试"]
}

# 为Streamlit应用提供的加载配置函数
def load_config():
    """加载系统配置
    
    Returns:
        dict: 配置字典
    """
    # 合并已有配置
    config = CONFIG.copy()
    
    # 添加学习资源配置
    config["LEARNING_RESOURCES"] = {
        "programming": [
            {"name": "Python核心编程", "type": "book", "difficulty": "中级"},
            {"name": "Coursera - Python编程", "type": "course", "platform": "Coursera"}
        ],
        "data_analysis": [
            {"name": "数据分析实战", "type": "book", "difficulty": "入门"},
            {"name": "Pandas数据处理", "type": "course", "platform": "Udemy"}
        ],
        "machine_learning": [
            {"name": "机器学习实战", "type": "book", "difficulty": "中级"},
            {"name": "吴恩达机器学习", "type": "course", "platform": "Coursera"}
        ]
    }
    
    # 添加行业映射
    config["INDUSTRY_MAPPING"] = INDUSTRY_MAPPING
    
    return config

# 直接导出配置对象，方便导入
config = load_config()

# 系统配置
CONFIG = {
    # API密钥
    "openai_api_key": "YOUR_API_KEY",
    "openai_base_url": "YOUR_BASE_URL",
    "boss_api_key": "YOUR_BOSS_API_KEY",
    
    # 数据源配置
    "job_sources": ["BOSS直聘", "智联招聘", "拉勾"],
    "report_sources": ["麦肯锡", "普华永道", "德勤"],
    
    # 模型参数
    "embedding_model": "text-embedding-3-small",
    "llm_model": "gpt-4o",
    
    # 系统参数
    "update_frequency": 24,  # 数据更新频率(小时)
    "similarity_threshold": 0.75,  # 相似度阈值
}

# 行业领域映射
INDUSTRY_MAPPING = {
    "AI医疗": ["医疗AI", "智能诊断", "医学影像AI", "智能医疗"],
    "绿色能源": ["新能源", "可再生能源", "清洁能源", "碳中和"],
    "数据科学": ["数据分析", "大数据", "数据挖掘", "商业智能"],
    "人工智能": ["机器学习", "深度学习", "自然语言处理", "计算机视觉"],
    "金融科技": ["区块链", "加密货币", "智能投顾", "金融AI"],
    "云计算": ["云服务", "云原生", "分布式计算", "容器技术"],
    "网络安全": ["信息安全", "网络防御", "安全审计", "渗透测试"]
} 